查看原文
其他

非劣效设计的临床研究需要注意的问题

写意君 同写意 2022-11-14

  ——

撰文 / @李宾,同写意临床研发特约撰稿人

编辑 / @Jingyu

本文共计3215个字,预计阅读时间需要3分钟。

* 感谢空军军医大学卫生统计教研室夏结来教授对本文提出修改意见



什么是非劣效试验?



非劣效性试验(Non-inferiority Trial, NIT)也是一种随机对照临床试验(Randomized Clinical Trial, RCT),旨在确认试验药在疗效上要是比阳性对照差的话,也在可以接受的范围内,可以用非劣效界值界定这个范围。阳性对照药一般都是选用公认有效的标准治疗药品,其疗效和安全性已经得到了确认。


为什么要采用非劣效试验的设计?



一个新药要开展非劣效性研究,而非优效性研究的原因是认为新药的疗效不一定会优于现有的产品,而且也没有必要一定要优于现有的产品,因为试验药在其他方面具有优势。例如:安全性更好,使用更方便(例如某些长效制剂,静脉注射改为口服等),成本更低,有更好的稳定性等。同时,在已有公认有效的产品上市的情况下,使用安慰剂作为对照,也不符合伦理的要求。

 

非劣效试验的统计方法



1)样本量的计算:非劣效试验的样本量可以通过公式来计算,也可以用统计软件来计算,例如SAS、PASS等。样本量的大小与α值(显著性水平)、把握度、非劣效界值和阳性对照药物的有效率有关。某些申办方寄希望于采用非劣效试验减小样本量,从而减少临床研究的费用,这是不切实际的,除非假定试验药稍微优于阳性对照,这种假定是很危险的。样本量越小,试验失败的风险也越大。如果研究结束后不能得出非劣效的结论,意味着临床研究的失败,也就是前功尽弃了。


2)统计检验:非劣效研究的统计检验是为了确认试验药的疗效在非劣效界值界定的拒绝域以内。在实际的运算上,往往是采用试验药与对照药疗效差值的区间来进行计算。通过公式或统计程序计算出差值的95%的置信区间,差值的置信区间位于拒绝域内即可。


下面列举一个具体的例子来说明这个问题。例如:研究数据显示试验药的疗效是88%,阳性对照药的疗效是89%。虽然试验药的疗效比对照药低1%,但从统计学的角度看,这种偏低可能是由于抽样误差导致的,事实上并不一定比对照药的低,所以进行统计检验。


假设预先确定的非劣效界值是10%。如果计算得到试验药-对照药差值的95%的置信区间是-5%到4%,那么这个范围是在-10%的非劣效界值界定的拒绝域以内,就可以得出非劣效的结论。如果计算得到差值的95%的置信区间是-15%到14%,那么差值的区间就在非劣效界值界定的拒绝域以外了,超出了拒绝域,说明试验药疗效不非劣于对照的的概率大于5%,也就不能排除他们相等,所以,在这种情况下,通过统计检验,不能确认试验药不劣于阳性对照药。


非劣效试验的结果有哪几种情况?



1)可能得到试验药优于对照药的结果。虽然最初的试验设计是按照非劣效试验设计的,但是在试验结束以后,如果试验药的疗效高于阳性对照药,而且直接将两个产品的疗效进行统计检验,得到的P值小于0.05,就可以认为试验药物的疗效高于阳性对照药了。一旦得出优效的结论,对产品的审批就非常有利。


作为一个新产品,总是可以找到除了疗效以外其他方面的优势的,这是现在非劣效试验设计比较多的原因。现在也有些新药的试验,一开始就采用优效性设计的方法,而不是非劣效的设计,说明新药的申办方对自己的产品非常有信心。而且一个优效性试验的结果,对产品上市后的市场开拓也是非常有利的。


2)得到试验药非劣于对照药的结果,这是试验设计的目标。如前所述,只要试验药和对照药疗效差值的95%置信区间在非劣效界值界定的拒绝域内,就可以得到试验药非劣于对照药的结论。此时试验药的疗效可能略高于对照药,或略低于对照药,或正好相等。但从临床医学学的角度看,这种差异是可以接受的,不会对临床治疗有实质性的影响。


3)得到试验药劣于阳性对照药的结果。虽然最初的试验设计是按照非劣效试验设计的,但是在试验结束以后,如果试验药的疗效低于阳性对照药,并且在进行统计检验以后,确认有统计学的差异,就可以认为试验药物的疗效低于阳性对照药。这种情况下,也有以下两种可能性:


a. 通过非劣效的检验,试验药疗效的下限超出了非劣效界值界定的拒绝域。这种情况下,不能得出试验药非劣于对照药的结论,而且能确认试验药的疗效劣于对照药。这种情况下,试验药的审批就很难通过了。


b. 通过非劣效的检验,试验药-对照药疗效差值的95%的置信区间落在非劣效界值界定的拒绝域内。这种情况下,非劣效检验可以得出试验药非劣于对照药的结论。但这种非劣效试验实际上也是劣效的结果,临床专家可能会认为这种劣效没有任何实质性临床意义。不管怎样,一旦出现了这样的情况,对新药的审批是不利的。


非劣效设计的临床研究需要注意的问题



非劣效界值的确定


虽然有统计学的方法来计算非劣效界值,但由于影响因素很多,既往的数据和参考的文献也不一样,对于非劣效界值的确定,很难找到一个标准答案。

统计学家认为,非劣效界值需要由临床专家来确定。但临床上的判断往往难以量化,所以临床专家往往会参考统计专家的意见。两方面的专家都尊重药审部门的意见,而药审部门也要参考专家的意见。

总的来讲,非劣效界值的确定,需要多个部门共同讨论来确定。非劣效界值与阳性对照的疗效差距越小,越能够说明试验药物非劣于阳性对照,但是需要的样本量越大,研究费用越高。非劣效界值太大,可能导致前文所说的情况,试验药的疗效劣于对照药,但是确是非劣效的。这种情况就依赖临床专家的判断了和审评人员的经验了。

阳性对照药的有效率的确定


研究开始前,阳性对照药的有效率是根据既往临床研究的结果和文献资料计算得到的。预估的对照药的有效率越高,需要的样本量相对越小。但在当前的临床研究中,由于入选和排除标准的不同,可能实际疗效与预估的疗效有差异。


一旦当前的研究中阳性对照的疗效低于预估的疗效,就可能出现把握度不足的问题,或者说,因为预估的样本量太低,经过统计检验无法得出非劣效的结论(P值大于0.05)。为了解决这个问题,可以采用中期分析的方法。

决决这个问题,有时通过中期分析,毕竟经过前期研究对试验药和阳性对照的差异有了一定的了解,应该相差不大。当前的研究中,采用盲态下样本量再估计。如果合并的有效率低于预设的阳性对照的有效率,需要增加样本量。

α值的确定


由于非劣效检验是单侧检验,所以a值一般需要定为0.025,双侧的a值为0.05。现在有的研究将单侧的a值定为0.05,这样双侧的a值就成为0.1了。这样做虽然可以使预估的样本量较小,但是这样的作法不一定能够得到药审部门的认可。

ß值的确定


ß值一般确定为0.1。有些研究中,将ß值确定为0.2,这样得话把握度(Power)就只有80%。虽然将ß定为0.2可以使预估的样本量较小,但是同时也增加了研究失败的风险,也就是说,由于样本量太小,研究无法得出非劣效的结论。现在药审部门也一般是要求将ß定为0.1。

分析人群


同优效性试验一样,一般采用意向性治疗原则进行统计分析,但同时也应该针对符合方案集进行分析。如果两者的结论一致,说明该研究具有良好的质量控制,结果可靠。如果两者得出的结论不一致,就应该进行进一步的讨论和分析。

总之,非劣效试验现在已经得到了广泛的应用,但非劣效试验中的一些具体问题,目前还没有确切的答案。需要各职能部门的沟通和协商,以及与药监部门的沟通和协商,共同解决问题。




李宾其它文章:

照搬流感?瑞德西韦临床方案设计的三大问题

瑞德西韦临床研究,存在失败风险!

基于真实世界研究进行药品注册研究的实操性问题



李宾,华氏康源国际事业部总经理

同写意临床研发特约撰稿人



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存